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三 种 数值 方法 在 几 种 六 道 木 分 类 中 的 应 用 * 
HER AHL HHA 


(SB E 大 学 ) 


二 十 世纪 五 十 年 代 英国 微生物 学 家 P. H. A. Sneath 和 美国 昆虫 学 家 R. R. Soka 首 
先 引 进 了 数学 统计 方法 和 应 用 电子 计算 机 于 生物 分 类 学 , 取得 了 显著 成 果 。 近 二 十 年 来 
国外 数值 分 类 学 ,在 这 方面 又 有 较 大 发 展 。 七 十 年 代 , 在 我 国 昆虫 学 和 微生物 学 领域 也 有 
AHR Ro, 

本 文 是 我 们 在 高 等 植物 中 运用 计算 机 进行 数值 分 类 的 初步 尝试 ， 目 的 是 为 了 对 三 种 
数值 方法 在 高 等 植物 分 类 中 的 运用 作 些 比较 并 积累 经 验 。 现 将 工作 情况 简报 如 下 : 


一 、 方 法 和 步 又 


我 们 选用 了 国产 的 下 列 几 种 六 道 木 作为 分 类 运算 单位 Operational Taxonomic Unit (H 
称 OTU) 

1. 糯米 条 Abelia chinensis R. Br，2. 双 花 六 道 木 4. biflora Turcz. 3. 小 时 六 道 木 
A. parvifolia Hemsl. 4. 二 翅 六 道 木 A. macrotera (Graebn. et Buchw.) Rehd. 5. 南方 六 道 
Æ A. dielsii (Graebn.) Rehd. 6.4099 AISA A. forrestii Diels 7. 醉 鱼 六 道 木 4. budd- 
leioides W. W. Smith 8. RENIX A. umbellata (Graebn.) Rehd. 9. 短 枝 六 道 木 4. engle- 
riana (Graebn.) Rehd. 

1. 特 征 〈Character or Attributes) 选择 : 我 们 采用 二 种 处 理 方法 : 《1) 选用 定性 特征 
Qualitative characters, 即 对 某 一 性 状 用 有 或 无 、 是 或 否 ， 十 或 一 等 非 此 即 彼 的 二 种 状态 
Binary states 来 表示 ,将 每 一 个 OTU 的 各 项 性 状 进 行 编码 ， 列 成 一 个 原始 数据 和 矩阵 Data 
matrix, 对 上 述 9 种 六 道 木 选用 了 54 TISERE LŠ 1)。(2) 由 于 对 高 等 植物 进行 数 
MORN, 二 态 特征 编码 常 有 不 足 之 处 ,除去 一 些 可 以 直接 测量 的 连续 量 要 人 为 划 线 外 ， 
还 遇 到 一 些 性 状 如 花 、 果 的 多 种 类 型 、 毛 的 不 同类 型 等 同一 性 状 有 多 种 状态 时 ,用 二 态 编 
码 来 表示 显然 不 够 用 ， 因 此 采用 多 态 编码 ， 从 有 序 多 态 Ordered multi-state 或 无 序 多 态 
Unordered multi-state 定量 特征 Quantitative characters 表示 ( 见 表 2)。 对 九 种 六 道 木 又 根 
据 标本 收集 了 47 个 定量 特征 列 为 矩阵 , 除 多 态 编码 外 , 其 中 包含 直接 度量 的 连续 量 有 13 
个 。 

2. 相似 性 测定 和 数学 模型 的 选用 :我 们 选 做 了 关联 系数 、 距 离 系数 及 相关 系数 三 个 
模型 。 

(1) 关联 系数 Coefficient of Association: ”是 由 二 态 定性 特征 编码 所 收集 的 数据 用 简 
单 匹 配 法 Simple matching methods 来 计算 的 . 


* 部 分 纸 带 穿孔 由 黄 笑 英 同志 承担 。 
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R1 九 种 六 道 木 性 状 二 态 编码 表 


1 ,灌木 (十 )? 草 本 (一 ) 

2. 直 立 ( 十 )? 葡 伏 ( 一 ) 

3. 梳 节 陪 大 ( 士 )? 不 膨大 (一 ) 

4. 当 年 幼 枝 红色 (十 )> 非 红色 (一 ) 

5. 嫩 枝 有 毛 ( 十 ), 嫩 枝 光滑 无 毛 ( 一 ) 
6. 毛 倒 生 ( 十 ), 不 倒 生 ( 一 ) 

7. 有 腺 毛 ( 十 ) 无 腺 毛 ( 一 ) 

8. 2A E+) BEC) 

9. 老 枝 是 灰色 (十 ?不 为 灰色 (一 ) 
10. ALBA +) RMB) 

11. 核 上 有 腺 点 (十 ) 无 腺 点 (一 ) 

12. 叶 对 生 及 轮 生 ( 十 )? 叶 互生 (一 ) 
13. 叶 无 柄 或 近 无 柄 ( 短 于 0.5 cm) 十 ), 有 柄 (一 ) 
14. 叶 两 面 不 同色 (十 ) 两 面 同色 (一 ) 
15. 叶 华 质 ( 十 )? 叶 纸 质 ( 一 ) 

16. 叶 片 披 针 形 (十 ) 非 披 针 形 (一 ) 
17. 叶 片 卵 形 (十 ), 非 卵 形 ( 一 》 

18. 叶 片 椭 贺 形 ( 十 ), 非 椭 贺 形 ( 一 》 


19. 叶 片 倒 生 (最 宽 部 在 中 部 以 上 XC 十 )、 非 倒 生 (最 宽 部 


在 中 部 以 下 X 一 ) 
20. 叶 片上 面 光滑 (七 )* 有 蓝 毛 (一 ) 
21. 叶 片 下 面 中 脉 上 有 绵 毛 (十 )* 中 脉 光滑 (一 ) 
22. 叶 片 顶 端 纯 尖 《十 ) 叶 片 顶端 长 浙 尖 (一 》) 
23. 叶 缘 全 缘 ( 十 )> 有 饥 齿 (一 ) 
24. 叶 片 基部 槐 形 ( 十 )? 基 部 宽 心 形 (一 ) 
25. 具 巷 片 (十 ), 不 具 苞 片 (一 》 
26. 具 总 花梗 (十 ), 不 具 总 花梗 (一 》 
27, 总 花梗 有 毛 ( 十 ) 无 毛 ( 一 》 


28. 花 具 小 花梗 (十 ), 不 具 小 花梗 (一 》 
29. 小 苞 片 三 此 形 (十 )? 叶 形 ( 一 ) 

30. 茜 檐 裂片 为 双 数 (十 ) 为 单数 (一 ) 

31. BH 2+). 45S (—-) 

32. GBH BRE +) BEC-) 

33. SW WRA E+) BAEC) 
34. 茜 榴 裂 片 宿 存 (十 )? 不 宿 存 (一 ) 


35. 花 冠 合 辩 ( 十 ) 分 离 ( 一 ) 
36. 花 冠 漏斗 形 ( 十 )> 钟 形 (一 》 
37. 花 冠 4 裂 (十 ) 5 BC) 


38. 花 冠 基色 为 红色 (十 ); 为 黄白 色 (一 ) 


39. 花 冠 简 外 有 短 柔 毛 ( 十 ?长 硬 毛 (一 ) 


40. 花 冠 简 内 喉 部 有 长 柔 毛 (十 ), 无 长 柔 毛 (一 ) 
41. ESS 4 C+). 5 枚 (一 ) 

42. ESAT IETS fC +) 9 HESS 1B A ETE RIM — D 
43. 花 丝 等 长 (十 )? 不 等 长 (一 ) 

44. 花 药 丁字 形 着 生 ( 十 )? 非 丁字 形 闭 生 (一 ) 
和. 子 房 下 位 (十 ), 子 房 上 位 (一 ) 

46. 子 房 三 室 (十 ) 子 房 非 三 室 (一 ) 

47. 中 轴 胎 座 ( 十 ), 非 为 中 轴 胎 座 ( 一 》 
48. 花 柱 丝 状 ( 十 )? 非 为 丝 状 (一 ) 

49. 柱 状 圆 形 (十 )? 非 为 圆 形 ( 一 ) 

50. 柱 头 伸 出 花冠 外 (十 ?不 伸 出 花冠 外 (一 ) 
51. 果 为 瘦 果 (十 ), 非 为 瘦 果 (一 》 

52. 果 基部 不 弯曲 (十 ) 果 基部 弯曲 (一 ) 

53. 条 积 明 显 ( 十 ), 不 明显 (一 ) 

54. 果 被 毛 ( 十 ) 果 无 毛 ( 一 ) 


表 2 九 种 六 道 木 性 状 多 态 编 码 表 


1, 节 不 膨大 (0), 节 膨大 (1) 

2. BRE IGE 0)» ECU—3) 

3. 具 短 柔 毛 (1), 硬 毛 (2), 倒 硬 毛 (4), 腺 毛 (8) 
4. 老 枝 光滑 (0)* 有 毛 (1 一 37 

5. 枝 不 纵 裂 (0)* 纵 裂 (17 

6. 枝 上 无 腺 点 (0)?* 有 了 腺 点 (17 

7. 叶 对 生 (0), 轮 生 (1) 

8. 无 叶柄 C0) 有 柄 《cm) 

9. 叶 片 两 面 同 色 C0), 两 面 不 同色 (1) 

10. 叶 片 纸 质 (0), 近 革 质 (17? 革 质 (27 
11. 叶 的 长 度 (cm) 

12. 时 的 宽度 《cm) 

13. 长 与 宽 之 比 

14. 叶 片 最 宽 部 位 在 基部 (2), 在 中 部 (3), 在 顶部 (4) 
15. 叶 片上 面 光滑 C0) 有 毛 (1 一 3) 

16. 叶 片 下 面 光 滑 (0), 有 毛 (1 一 3) 

17, 叶 片 顶 端 长 浙 尖 (1), 渐 尖 (2), 钝 (人 


18. 叶 片 基部 模 形 (1), 宽 棉 形 (2), 贺 钝 (4) 

19. 叶 片 全 缘 (0)? 有 齿 (1 一 37 

20, 不 具 总 苞 (07; 总 苞 长 度 《〈cm) 

21. 无 总 花梗 (0), 总 花梗 长 度 《cm) 

22. 总 花梗 无 毛 (1) ,有 毛 (2 一 和 

23. 无 花梗 (0), 有 花梗 《cm) 

24. 小 巷 片 三 齿 (1D)3 三 了 时 形 C2), 一 叶 形 (3) 

25 .等 榴 裂片 数 为 (2)42(57 

26. BRAKE (cm) 

27. SAE RE (cm) 

28. 长 与 宽 之 比 

29. 葡 榴 裂 片 的 最 宽 部 分 在 底部 (2), 中 部 (3), 顶 部 (4》 
30. 葡 榴 裂 片 的 边缘 有 纤毛 (0 一 3) 

31. 花 冠 的 形状 高 脚 碟 形 (1)* 钟 状 漏斗 形 (27* 钟 形 (37 
32. 花 冠 的 长 度 (cm) 

33. 花 冠 的 宽度 (cm) 

34.46 EB CAD) 
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续 表 2 
35 .花冠 的 颜色 : 红色 (0), 黄 色 (1) 42. 花 丝 与 花冠 简 长 度 之 比 
36. 花 等 简 外 具 短 柔 毛 (0 一 3) 各. 花柱 长 度 (cm) 
37, 花 冠 简 外 具 硬 毛 (0 一 3》 44. 花 柱 与 花冠 简 长 度 之 比 
38., 花 冠 简 内 喉 部 有 无 毛 (0 一 3) 45. 成 熟 瘦 果 长 度 (cm) 
39.14) 9G) 46. RiR ERR BE O—3) 
40. 雄 蕊 的 平均 长 度 《cm) 47. 瘦 果 外 有 无 毛 (0 一 37 


41. 花 丝 有 无 毛 (0 一 3) 





P(A AB) + NCAAB) 
AB 


mean (P(A) + NCA), P(B) + N(B)) 


min 
其 中 PC4) 为 OTU 4 中 (十 ) 的 个 数 ，N(4) 为 OTU 4 中 (一 ) 的 个 数 ，P(4 八 B) 表 
示 4 与 也 两 个 OTU 各 项 性 状 比较 时 所 得 的 相同 (十 ) 的 个 数 ， NGC4AB) RRAS BY 
个 OTU 各 项 性 状 比较 时 所 得 的 相同 (一 ) 的 个 数 ， 
MaxP(A) + N(A), P(B) + N(B)) 
表示 4 与 B 两 个 OTU 比较 时 定 态 性 状 (不 包括 NC = no comparison) 个 数 的 大 者 (下 
简称 大 分 母 法 ) Min (P(A) + N(A), PC) +N(B)) 表示 4 与 B 两 个 OTU 比较 时 定 
态 性 状 个 数 的 小 者 (下 简称 小 分 母 法 )，Mean 表示 算术 平均 数 (下 简称 中 分 母 法 ). 
(2) 距离 系数 Distance Coefficient: 
1 
2|2 


Dik = be ci(aij = aik) | 

i=1 ! 

其 中 Dy 表示 第 7 个 OTU (4) 与 第 & 个 OTU (4g) 的 距离 系数 ，Di < Di 时 ,表示 
Ay 比 4; 更 接近 43 权 系数 c; 用 来 调整 不 同 测试 度量 单位 引起 的 不 一 致 ， 也 可 以 用 来 加 
强 或 削弱 某 些 性 状 在 分 类 中 的 地 位 ,但 本 文 ci = (max (a,;)) 一 暂 只 用 调整 测试 数据 的 差 
异 (相当 于 标准 化 ), 而 未 用 加 强 或 削弱 某 些 性 状 的 办 法 , a 表示 第 7 个 OTU 中 第 i 个 


特征 的 编码 。 
(3) 相关 系数 Coefficient of correlation 


> (xij — x4) Cei — Fe) 


Cd; dx)? 
其 中 zx; 为 第 i 个 OTU 的 第 i 特征 值 ,如 为 第 7 个 OTU 的 全 部 特征 值 的 平均 数 。 
dj ys Ds Cxi — zy 
我 们 分 别 将 9 种 六 道 木 一 组 二 态 数据 矩阵 ( 表 1) 按 关联 系数 公式 , 一 组 混合 数据 矩 
阵 mixed-data matrix 〈 将 有 序 多 态 \ 无 序 多 态 人 工 转化 为 连续 量 , 见 表 2) 按 距 离 系数 和 相 
关系 数 的 公式 ,在 我 校 719 机 (32k X 48bits，12.5 万 次 / 秒 ) 上 用 ALGOL 语言 程序 进行 


运算 。 求 其 相似 系数 。 
3. 聚 类 分 析 Cluster analysis 和 绘制 树 谱 图 Dendrogram 


Rix 
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根据 定性 特征 和 定量 特征 的 不 同情 况 ,先后 编制 了 5 个 程序 ( 即 No. 5，No. 6, No.9, 
No. 7 及 No. 10)。 前 3 个 是 按 关联 系数 公式 编写 的 ; 后 2 个 程序 No. 7 REE REA 
式 编写 的 ，No. 10 是 按 相关 系数 公式 编写 的 。 上 机 运算 后 的 结果 进行 聚 类 分 析 和 绘制 
树 谱 图 。 关 联系 数 采 用 拟 最 近 距 离 法 ( 即 选 关联 系数 最 大 值 先 聚 类 ) 和 多 相关 * Maulti-cor- 
relation 〈 即 二 个 以 上 的 OTU 直接 对 位 相关 ) 聚 类 ; 距离 系数 和 相关 系数 以 单 联 法 Simple 
Linkage 和 平均 联 法 Average Linkage 聚 类 和 绘图 。 


二 、 结果 和 分 析 


以 9 种 六 道 木 为 例 , 用 多 元 聚合 法 对 高 等 植物 进行 数值 分 类 是 可 行 的 。 由 六 道 木 定 
性 和 定量 的 二 组 数据 分 别 按 关 联 、 距 离 和 相关 三 种 系数 公式 运算 的 结果 如 表 3、4、5。 据 
其 绘制 了 树 谱 图 如 图 1:1, 图 1:2, 图 2, 图 3。 现 分 析 如 下 : 

1. 以 定性 数据 按照 关联 系数 公式 算出 结果 所 绘 的 树 谱 图 (图 1:1) 来 看 , 相似 值 愈 大 
表示 两 个 OTU 愈 相似 。9 种 六 道 木 中 第 一 级 联合 中 出 现 了 3 个 对 子 , 即 OTU 9 KKK 
六 道 木 与 OTU 4 DAWA; OTU 1 糯米 条 与 OTU 6 细 瘦 六 道 木 ; OTU 2 MEN 
道 木 和 OTU 8 聚合 六 道 木 。 由 于 条 件 的 限制 , 目前 我 们 所 收集 的 数据 仅仅 根据 腊 叶 标 
本 的 形态 特征 ， 因 而 树 谱 图 中 所 表示 的 各 种 之 间 的 相似 程度 可 以 和 经 典 分 类 工作 的 结果 
相 比 较 。 

第 一 对 短 枝 六 道 木 和 二 翅 六 道 木 的 关联 系数 最 高 值 为 81.48 一 83.01， 反 映 了 这 两 个 
种 在 生殖 器 官 花 部 形态 如 花冠 形状 、 划 裂片 数目 、 雄 蕊 的 结构 等 方面 都 很 相似 ,前 者 仅仅 
花冠 较 短 ,花序 多 腋生 ,后 者 花冠 较 长 , 花序 顶 生 于 侧枝 。 花枝 时 营养 器 官方 面 除 叶 形 大 


* 示例 





4 与 了 命中 性 状 第 1。 25 3 号 记 作 : 
R(4, B)=(1, 2, 3) ”命中 率 r+(4， B)=Ž 
RCA, C)= (1,2,4) 命中 率 (4, Omi 
R(B, C) = (1, 2) 命中 率 r(B，C) 一 全 
R(4, B, C)=(1, 2) ”命中 率 r(A, B, c)= 4 
R(A, B, C, D) = 空 的 ”命中 率 r(A, B, C, Dy= 2 


its 为 一 些 OTU 的 集合 
r(s)=s 中 所 有 OTU 具有 相同 性 状 的 项 数 / 总 项 数 
定义 r(s) 为 :的 多 相关 关联 系数 。 
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小 的 差别 外 ,也 十 分 相似 ,仅仅 前 者 叶 较 小 ,后 者 叶 较 大 。 
第 二 对 糯米 条 和 细 瘦 六 道 木 相似 值 为 77.35 一 78.84， 同 样 反映 了 它们 在 花冠 形态 和 
叶 的 形态 也 十 分 相似 。 那 么 为 什么 不 与 前 一 对 联合 起 来 呢 ? 因为 他 们 在 苯 裂 片 性 状 方面 
有 许多 不 同 。 短 枝 六 道 木 与 二 翅 六 道 木 的 苯 裂 片 数 为 2， 而 糯米 条 和 细 瘦 六 道 木 的 葛 裂 
片 数 为 5。 
第 三 对 双 花 六 道 木 和 聚 们 六 道 木 在 营养 器 官 和 生殖 器 官 的 结构 上 彼此 都 十 分 相似 ， 
而 与 上 述 两 个 对 子 则 有 许多 不 同 之 处 ,除了 花冠 形态 和 邦人 巷 的 结构 之 外 ,， 昔 裂 片 数 为 4。 
由 此 可 见 ， 数 值 分 类 的 树 谱 图 中 数值 的 差异 可 以 细致 的 从 数量 上 反映 出 OTU 之 间 
的 总 体 相 似 程度 。 虽 然 在 种 类 有 限时 ,这 种 相似 关系 ,有 经 验 的 分 类 学 家 可 以 直观 地 作出 
科学 判断 ;但 在 大 量 OTU 时 ,要 精细 地 ,数量 地 表示 , 人 为 判断 很 难 做 到 ,而 数值 分 数 方 
法 则 可 以 细致 地 ,准确 地 表示 。 
在 求 得 相似 系数 后 ,我 们 采取 拟 最 近 距 离 法 ( 选 最 大 值 ) 和 多 相关 法 绘制 了 图 1:1 和 
图 1:2。 比 较 这 两 个 图 , 在 图 1:1 中 , 由 于 几 处 关联 系数 相同 而 出 现 了 掌 状 分 枝 , DH 
. 低 。 多 相关 是 直接 对 位 ,相关 比较 严格 ,分 辩 率 高 。 总 之 , 聚 类 的 方法 不 同 ,会 影响 到 分 类 
结果 。 
2. 以 定量 数据 按照 距离 系数 公式 和 相关 系数 公式 算出 的 结果 来 看 ， 前 者 取 值 范围 为 
正 值 ,定义 距离 系数 愈 小 愈 相似 ;后 者 取 值 范 围 为 + 1 一 一 1, 数值 愈 大 愈 相似 。 在 9 种 
六 道 木 育 类 过 程 中 ,两 种 方法 的 第 一 步 都 分 出 二 个 相似 的 对 子 , 即 OTU 2 双 花 六 道 木 和 
OTU 8 RAIA; OTU 3 小 时 六 道 木 和 OTU 9 短 枝 六 道 木 ,在 下 一 步 育 类 循环 时 ， 
OTU 5 南方 六 道 木 与 双 花 六 道 木 、 聚 伞 六 道 木 联合 起 来 ， 而 OTU 1 糯米 条 和 OTU 6 
细 瘦 六 道 木 在 距离 系数 图 中 联合 起 来 ,在 相关 系数 中 和 OTU 7 醉 鱼 六 道 木 联 合 起 来 , 然 
后 逐步 与 短 枝 六 道 木 和 小 叶 六 道 木 联合 起 来 成 为 一 群 。 这样, 将 9 种 六 道 木 按 其 总 体 相 
似 度 Cover all similarity) 分 为 二 大 类 群 ， 即 双 花 六 道 木 、 聚 全 六 道 木 和 南方 六 道 木 为 一 
群 , 短 枝 六 道 木 、 小叶 六 道 木 、 双 翅 六 道 木 、 糯 米 条 、 细 瘦 六 道 木 和 醇 鱼 六 道 木 为 另 一 群 。 
双 花 六 道 木 等 三 种 共同 具有 枝 干 节 部 膨大 , 苯 榴 4 裂 , 花 冠 高 脚 碟 状 漏斗 形 、4 裂 ,雄蕊 内 
藏 等 性 状 。 而 短 枝 六 道 木 等 6 种 所 具有 的 共同 性 状 为 梳 干 节 部 不 脱 大 , 花冠 钟 形 、5 R, 
雄蕊 不 内 藏 并 不 同 程 度 伸 出 花冠 外 等 。 在 图 3 中 OTU 4 双 翅 六 道 木 又 先 与 短 枝 六 道 木 
和 小 叶 六 道 木 联合 成 小 群 ， 这 三 个 种 除 具 前 述 共 同 特征 外 ， 其 敬 榴 裂片 数 均 为 2。 糯米 
条 、 醉 鱼 六 道 木 和 细 瘦 六 道 木 在 相继 循环 过 程 中 逐步 轨 到 这 一 群 中 去 。 在 图 2:b 中 ,糯米 
条 和 细 瘦 六 道 木 在 后 继 的 聚 类 循环 中 联合 起 来 ,反映 了 他 们 除 具 上 述 共同 特征 外 ,其 苯 构 
裂片 数 均 为 5。 比较 图 2 和 图 3, 大 体 一 致 , 都 将 9 种 六 道 木 分 成 两 大 类 群 , 可 以 说 相当 
于 经 典 分 类 学 中 将 本 属 分 成 的 二 个 组 section， 即 包含 双 花 六 道 木 、 聚 伞 六 道 木 和 南方 六 
道 木 的 Zabelia 组 和 包含 短 枝 六 道 木 、 小 时 六 道 木 .二 翅 六 道 木 .糯米 条 、 细 瘦 六 道 木 和 本 
鱼 六 道 木 等 的 Euabelia 组 。 在 后 一 组 中 各 个 种 在 结合 的 先后 和 树 谱 图 形式 稍 有 不 同 , 是 
由 于 多 元 性 状 中 不 同 数值 由 不 同 聚 类 方法 而 引起 的 。 BZ. 从 上 述 分 析 来 看 ， 数 值 分 类 
不 仅 可 以 用 数值 方法 表示 分 类 群 之 间 的 相似 程度 ， 也 可 以 用 来 划分 分 类 等 级 ， 尤 其 是 在 
OTU 数量 众多 时 ,能够 实现 分 类 学 家 难以 解决 的 分 类 问题 。 
根据 上 述 3 种 图 型 的 比较 ， 我 们 认为 以 定量 数据 按 距 离 系数 和 相关 系数 育 类 的 结果 
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图 1:1 六 道 木 ? 按 关联 系数 绘 出 的 树 谱 图 
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图 2 六 道 木 , 按 距 离 系数 给 出 的 树 谱 图 
a. URE; b. 平均 联 法 。 
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图 3 六 道 木 , 按 相关 系数 绘 出 的 树 谱 图 
a. 单 联 法 ; b. 平均 联 法 。 





图 1:2 六 道 木 , 按 关联 系数 绘 出 的 多 相关 树 谱 图 
b. 中 分 母 ; c 小 分 母 。 2a， 大 分 母 ; b. 中 分 母 ; c 小 分 母 。 
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-一 
表 3 用 关联 系数 公式 求 出 九 种 六 道 木 的 相似 值 


74.07 
8 * 74.76 

75.47 
9 * 


注 : 表 中 第 一 行为 大 分 母 的 结果 ,中 行为 中 分 母 的 结果 ,第 三 行为 小 分 母 的 结果 。 


表 4 用 距离 系数 公式 算出 的 距离 
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表 5 用 相关 系数 公式 求 出 的 相似 值 








7 8 



























OTU 5 6 

1 一 0.0478 0.1564 | —0.2594 | 一 0.2012 
2 * —0.2785 | —0.3305 0.4155 | —0.4002 | —0.1271 0.5417 | —0.4816 
3 — 0.0962 | — 0.4136 | —0.0757 0.0270 | —0.4577 0.4939 
4 * — 0.3208 0.0939 | —0.3423 | —0.2651 0.3624 
5 * —0.3655 | —0.2768 0.4865 | —0.4567 
6 * 0.0573 | — 0.2834 0.0280 
7 * 一 0.1966 | —0.2413 
8 

9 


比 以 定性 数据 按 关 联系 数 聚 类 的 结果 适用 、 优 越 。 

3. 通过 上 述 结果 的 比较 ,分 析 原 因 与 分 类 特征 的 确立 、 数据 的 取得 直接 相关 , 以 二 态 
编码 取得 的 定性 数据 与 以 多 态 编码 和 实测 连续 量 的 混合 定量 数据 ， 分 别 以 三 种 系数 公式 
计算 的 结果 来 看 ,二 态 编码 表示 特征 中 遇 连 续 量 和 有 序 多 态 及 无 序 多 态 的 差别 时 ,人 为 转 
换 会 损失 一 些 信息 和 带 有 较 大 的 主观 性 , 并 且 有 这 样 那样 的 失真 。 而 用 多 态 及 连续 量 表 
示 特 征 时 ， 则 可 避免 上 述 的 缺点 而 且 分 辩 率 也 高 。 对 高 等 植物 进行 数值 分 类 ， 如 何 对 
OTU 选取 分 类 特征 ， 如 何 进行 编码 和 测量 数据 是 生物 分 类 学 家 必须 深入 研究 的 课题 之 


三 、 讨论 

进行 数值 分 类 ,特别 是 借助 计算 机 来 进行 分 类 , 首先 必需 研究 和 确立 分 类 的 依据 、 分 
类 的 原则 和 工作 步骤 。 在 我 们 工作 过 程 中 ， 首 先 遇 到 的 有 单元 或 多 元 Monothetic versus 
polythetic、 划 分 法 或 率 合 法 divisive versus agglomerative, 加 权 或 不 加 权 Weighting versus 
unweighting 等 三 个 基本 问题 需要 加 以 考虑 和 确定 。 

单元 或 多 元 分 类 : 单元 分 类 是 根据 单项 性 状 进行 分 类 。 在 经 典 分 类 的 检索 表 中 以 一 
项 性 状 来 划分 就 属于 这 一 类 ， 在 植物 群落 分 类 中 也 常 被 采用 。 其 优点 是 简单 明确 、 计算 
快 ;缺点 是 选用 了 无 关 重要 的 性 状 ,就 会 造成 无 意义 的 划分 中 。 目前 在 许多 分 类 检索 表 中 
也 不 都 是 根据 单项 性 状 ,常常 是 列 出 几 项 性 状 , 有 时 性 状 之 间 有 交叉 和 重 又 。 我 们 的 工作 
是 根据 分 类 单位 的 总 体 相 似 , 属 于 多 元 分 类 。 

划分 或 聚合 两 种 方法 ,在 数值 分 类 中 都 可 运用 。 育 合法 是 从 一 些 分 类 单位 出 发 ,根据 
相似 程度 逐步 聚合 归 类 ,一 般 在 分 类 学 中 应 用 较 多 。 划 分 法 是 从 一 个 总 体 逐 步 划 分 ,一 般 
在 植物 群落 分 类 中 应 用 较 广 ea。 本 工作 是 采用 育 合 法 ,因此 结果 与 聚 类 分 群 的 方法 有 密 
切 关系 。 单 联 法 .平均 联 法 比较 简便 易 行 ,但 不 够 理想 。 多 相关 比较 严格 合理 , 它 是 性 状 
直接 对 位 相关 ,有 一 定 的 优越 性 ,但 只 能 于 二 态 数据 按 关 联系 数 公 式 中 加 以 应 用 。 

加 权 问 题 : 本 工作 是 初次 按 数 值 分 类 学 中 表 型 学 派 所 主张 的 阿 当 示 平权 原则 Princi- 
ple Adansonian 分 类 的 , 采用 了 大 量 的 性 状 , 但 许多 经 典 分 类 学 家 强调 生殖 器 官 特征 的 重 
要 性 ,认为 它们 比 起 营养 器 官 的 特征 稳定 可 靠 \、 变 异 幅 度 小 。 这 样 , 对 作为 分 类 基础 的 各 
项 特征 性 状 不 应 等 同 看 待 ,就 有 一 个 生物 意义 的 权 问题 。 我 们 认为 对 权 的 问题 ,要 视 如 何 
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确定 特征 ,要 作 具 体 分 析 。 如 对 某 一 器 官 选 用 特征 愈 多 ,实际 上 无 形 中 就 相应 地 对 这 一 器 
官 加 权 了 。 如 果 用 权 系数 来 调节 , 可 以 最 大 限度 的 接近 平权 。 本 文中 尚未 用 这 种 权 系数 
调节 ,因此 结果 与 特征 选择 直接 有 关 。 

近 几 年 来 数值 分 类 学 发 展 十 分 迅速 ,内 容 很 广 ,计算 机 的 应 用 为 分 类 学 研究 提供 了 愈 
来 愈 多 的 方便 ,如 模拟 生物 演化 系统 ,绘制 分 支 系 统 图 ”六 ;建立 植物 数据 库 和 自动 鉴定 
iy”, 绘制 大 面积 的 植物 分 布 图 中; 打印 有 关 检 索 表 号 ; 以 及 标本 室 资 料 信息 储存 
和 检索 等 许多 方面 ， 范 围 极其 广泛 ， 引 起 了 国内 外 许多 生物 分 类 学 家 和 应 用 数学 家 的 兴 
趣 , 有 待 共同 协作 ,进行 研究 。 
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THREE NUMERICAL APPROACHES TO THE CLASSIFICATION 
OF CHINESE SPECIES OF GENUS ABELIA 


Hu CHIA-CH’I CHU MING-YUAN SHU TZU-SHENG 


(Fudan University) 
Summary 


In the last 10—20 years there has been increasing awareness of the problem con- 
cerning the aims and practices of taxonomy. In particular, there has been growing 
interest in the development of numerical methods in biological taxonomy as an aid to 
making systematics a quantitative science, a step which comes in time to almost every 
scientific discipline. 

Numerical taxonomy is the evaluation by numerical methods of the affinity or 
similarity between taxonomic units and the employment of these affinities in erecting 
a hierarchic order of taxa. The present rapid development of these ideas is presuma- 
bly a result of the development of computer techniques. 


Numerical taxonomic approach has been applied to the studies of entomology and 
microbiology in China to some extent since 1975. But so far it hasn’t been commonly 
used in botany. The present report is a preliminary study on 9 spp. of the genus 
Abelia. A set of binary data with 54 characters is used for computing association 
coefficient; and a set of quantitative data with 47 characters for distance coefficient 
and correlation coefficient. For the mathematical models were chosen the non-metric 
simple matching association coefficient, the geometrical distance of Riemannian space 
and correlation coefficient. Computational procedures are stepwise presented in detail 
and computer programmes are written in the background of Algol-60 language. 
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Cluster analysis is compared with simple linkage, average linkage and multi- 
correlation. 

The results of DC and CC for 9 spp. of Abelia agree closely with the traditional 
taxonomy, because the data we collected mainly come from morphological characters. 
It would seem that the results of quantitative data are more appropriate for seed 
plants. It is, therefore, postulated that our programes are complementary and very 
useful to a wide range of classification entities, such as microbes, animals and plants 
in present situation in China. 

In conclusion, a comparison between the conventional taxonomy and numerical 
taxonomy has been made, and a brief discussion of three problems, i.e. the monothetic 
versus polythetic, divisive versus agglomerative, weighting versus unweighting. 


